ИНФОРМАЦИИ

5.1. Непараметрическое оценивание функции распределения времени безотказной работы

В монографии М. Холландера и Д. Вульфа по непа- ;раметр’ическим методам статистики [26] указывается на три «прорыва» в области непараметрических методов «статистики: теорема А. Н. Колмогорова (1933 г.) о пре — .168

дельном поведении наибольшего уклонения эмпириче­ской функции распределения от теоретической (стати­стика Колмогорова); открытие (1945 г.) ранговых кри­териев; использование ранговых критериев для оцени­вания неизвестных параметров (1963 г.). Четвертым «прорывом» в области непараметрических методов ста­тистики следует назвать непараметрические методы об­работки результатов испытаний и эксплуатации, пред­ложенные учеником А. Н. Колмогорова Ю. К. Беляевым (1984 г.) и ориентированные на широкое использо’вание вычислительной техники.

Расширяющееся применение вычислительной техники при обработке данных об эксплуатации сложных систем настоятельно требует поиска новых унифицированных и динамичных форм-представления статистических-данных и обобщенных непараметрических методов обработки статистических данных. Сейчас каждому плану специ­ально организованных испытаний на надежность одно­типных изделий и каждому виду функции распределе­ния их времени до отказа соответствуют свои формулы обработки данных о надежности.

Однако данные об эксплуатации поступают порция­ми. Они не подходят ни под какой из существующих планов испытаний. В начале эксплуатации систем эти данные неполные, затем банк статистических данных начинает пополняться. Будем считать далее, что имеем дело в эксплуатации с массовыми однотипными изде­лиями, т. е. данных об их надежности много. При их статистической обработке получаем функцию распреде­ления .времени безотказной работы, которая не будет следовать никакому известному параметрическому семейству распределений (подбор для реальных распре­делений известного распределения всегда является приближенным). Поэтому в последние годы в матема­тической статистике вводятся классы произвольных и стареющих распределений. При этом предполагается непрерывность функций распределения, т. е. существо­вание плотностей распределений.

Практически сглаживание эмпирической функции распределения непрерывной кривой имеет место всегда, когда скачки эмпирической функции малые. В против­ном случае нельзя считать, что функция распределения имеет плотность (этот общий случай тоже будет рас­смотрен). В процессе эксплуатации данные могут на —

напливаться планово или поступать в случайные момен­ты времени. Удобным представлением эксплуатацион­ных данных о надежности изделий является агрегиро­вание, предложенное Ю. К. Беляевым в [5]. При этом не происходит потерь эксплуатационной статистической информации и дается обобщение вариационного ряда.

Рассмотрим эксплуатационные цензурированные ста­тистические данные о надежности изделий. Будем счи­тать, что возможно снятие изделий с эксплуатации либо. в заранее назначенные моменты времени, либо после отказов (цензурирование в выбранные заранее моменты времени или после отказов). Пусть имеем N длительно эксплуатирующихся изделий. Для изделия Qt(i= 1, N) до начала эксплуатации определяем момент замены S. Если изделие отказывает в момент ti^Si, то этот мо­мент фиксируется в банке данных. Каждое изделие до момента Si может отказать неоднократно. Статистиче­ские эксплуатационные данные имеют вид (й,, . . ■, t;а Sji;. . ., SJk) . Здесь 1= (й,…, і а) •— номера изделий, у которых соответственно наблюдалось 1,…, а отка­зов, а / = (уь. . ., yh) — номера изделий, у которых цен­зурировались соответственно 1,.. ., &-е отказы, т. е. из­делие снималось с эксплуатации соответственно до на­ступления 1,. . . , Л-‘го отказа.

Ю. К — Беляев в [5] предлагает обобщенные эксплуа­тационные данные (с учетом цензурирования) представ­лять в виде таблицы D из трех строк:

ИНФОРМАЦИИ(15.1)

Здесь первая строка — возрастающая последователь­ность моментов времени (наработки) z;(t=l, ii). В эти моменты либо происходят отказы, либо цензурирование. Вторая строка формируется таким образом, чтобы в t-м столбце записывалось число отказав fi, соответствующее наработке zt (.наработкой Zi начинается І-й столбец). Третья строка записывается так, чтобы в і-й столбец попадало число изделий ct-, которые были сняты с экс­плуатации до наступления отказов (были цензуриро­ваны).

Форма записи данных (5.1) весьма общая. Например,, для планов испытаний [п, Б, г] и [п, Б, Т] без замен от­казавших изделий (5.1) запишется соответственно как:

ИНФОРМАЦИИ

ИНФОРМАЦИИ

В плане [п, Б, г] изделия испытывают до r-го отказа; (/■<;«), поэтому tr — момент цензурирования п — г из­делий. В плане [п, Б, Т] изделия испытывают в течение — времени Т. При этом наблюдается d отказов (OsSld^n), момент Т — момент цензурирования п — d неотказавших изделий. Подробно о планах испытаний изделий на надежность можно прочитать в [11].

Форма записи данных (5.1) является общей, универ­сальной и удобной для обработки данных на ЭВМ. Объ­единение данных таких таблиц также очень удобно. Пусть, например, статистическая эксплуатационная ин­формация о надежности однотипных изделий задана в виде двух таблиц:

ИНФОРМАЦИИ

При построении объединенной таблицы предполага­ется, что условия эксплуатации изделий, соответствую­щие данным таблиц D и D2, примерно одинаковы. Упо­рядочиваются массивы {z’і) и {z"i} по возрастанию значений z. Если найдутся равные z’i{i = 1, 2, .. ., п) и (/=1, 2,, к), k>n, то столбцы объединяются. Напри­мер, если общему значению z’i=z"j в таблице П3 соот­ветствует k-й столбец, то вторая его строка — сумма f’i+f’i, а третья — сумма c’i + c"j. Если

z'<z"i<z< z"2<z’3=z’!4< … ■

. . . <z’i<z"i< . . . z’n<z"n< — ■ . z’k,

ИНФОРМАЦИИ

тго таблица имеет вид

Программы объединения данных таких таблиц на ЭВМ с целью применения в последующем единых алго­ритмов их обработки уже имеются.

Основополагающими для непараметрической обра­ботки данных эксплуатации, поступающих в виде (5.1), являются две случайные функции, введенные Ю. К — Бе­ляевым: D(t) — число отказов при наработке изделий, не меньшей, чем t, и N(t)—число изделий с наработ­кой, не меньшей, чем t.

Подсчет этих функций удобно осуществлять по спе­циальным программам на ЭВМ на основании данных в виде (5.1). Покажем, как определять функции D<(t) и N (t) по данным (5.1). Рассмотрим следующие функции, которые назовем индикаторами событий, указанных в скобках (известно, что если произошло указанное собы­тие, то индикатор равен 1; в противном случае он при­нимает значение 0):

( 1, если Zj^t, fj>’0;

ь>0)= 1

L О в противном случае.

Подпись: / (;zj > t) =1, если Zj^t, ‘0, если Zj<t.

Тогда на основании данных (5.1):

Л(<) = 2 f}>0); (5.2)

/=! ll

JV(0=S (fi+Cj)I(zj>t). (І5Л)

/=і

Очевидно, что общее число изделий в начале эксплу-

П

атации (при t—0) N (0) = Е (fj + O)- Об этом числе

і= і

изделий имеются данные в (5.1).

В [5] показано, как по предложенной Ю. К. Беляевым общей схемы представления данных (5.1) и с. использо­ванием введенных им функций D(t) и N‘(t) получить оценки функции распределения времени безотказной

работы изделий для уже ставшей классической процеду­ры испытаний А. Н. Колмогоров а. В этом случае имеем независимую выборку объема N, все изделия прорабо­тали до отказа, цензурирование отсутствует.

Для рассматриваемой ситуации (5.1) имеет вид

Подпись: ( А, А, ■. • і tn (5.4)

где ti(i— 1,…, п)—моменты отказов в порядке роста их зна­чений.

Подпись: D(t) [ТУ — D(t)] да(уу-,і) Подпись: 2 Подпись: F (0—«і-ї
Подпись: 2
ИНФОРМАЦИИ

В (б] показано, что оценка максимального правдопо­добия для вероятности безотказной работы F (t) = = (N — D (t)) /N. Эта оценка несмещенная. При конеч­ном N приближенный у-доверитель’ный интервал для вероятности безотказной работы F (t) (для фиксирован­ного t) ‘Определяется как

ИНФОРМАЦИИ

где их___ — квантиль нормального распределения.

~2~

Более полной характеристикой точности оценки F(t), чем доверительный интервал, является доверительная полоса (она характеризует точность оценки F (t) непре­рывно по t). Считаем, что уД°веРитель’н&я полоса для F определена с помощью двух функций: фн(0 =

= iprf(f, Э)^ч|)в(^) =фв(А D) на интервале (О, U), если Р{фн(0 ^F (t) ї=;я[)в (t) для всех fe[0, ^о]} Ssy. Это зна­чит, что с вероятностью, не меньшей -у, F (і) находится в полосе i1)h(0^^b(0- Эта полоса для рассматриваемо­го классического случая А. Н. Колмогорова имеет вид

Fjt)—yт IV JV<FK)<F(i) + yT /j/yv. fcp), оо], где F(t)=[N—D(t)]l’N — квантиль уровня у-распределения

+0О

Колмогорова k(y) : К(у)= 2 (—1)йе-2*2»2.

Подпись: Несмещенная оценка дисперсии времени безотказной работы изделия Z~a2e/Ns^.mesS.mF+Ui-'i a2elN.. 2

По данным (5.4) находится несмещенная оценка ма­тематического ожидания mF времени наработки изделия на отказ:

Доверительный интервал для mF запишется так:

те — Иі-Т

2

Таким образом, Ю. К. Беляев показал, что) В’ его обобщенную схему укладывается классический пример А. Н. Колмогорова, который сейчас по существу лежит в основе непараметрических методов обработки резуль­татов испытаний на надежность. Более того, он впервые доказал, что можно получать аналогичные результаты и для более общего случая, каким является случай длительной эксплуатации восстанавливаемых (заменяе­мых) изделий при наличии замен не только после отка­зов (при цензурировании).

Будем считать, что цензурированные данные о на­дежности восстанавливаемых в процессе эксплуатации изделий задаются (5.1). При этом в основе точечной оценки F (t) вновь будет лежать принцип максимально­го правдоподобия. Ниже будем иметь дело с общей мо­делью цензурирования и общим классом функций рас­пределения.

ИНФОРМАЦИИ

Выпишем формулу Ю. К. Беляева для оценки мак­симального правдоподобия F (/) вероятности безотказ­ной работы F(t), применение которой практически нё имеет ограничений для непрерывных функций F{t):

Из приведенной оценки F(t) для общего случая сле­дует оценка для частного случая А. Н. Колмогорова, ■когда цензурирование отсутствует и исходные данные записаны в виде (5.4). Оценки вида (5.5) принято назы­вать множительными оценками.

При решении задач обработки результатов эксплуа­тации можно пользоваться следующими формулами для доверительных интервалов и полос функции надежности

______________________________________________________________________________ со

F(і) и оценки математического ожидания mjp= J tdF(t).

о

В процессе эксплуатации изделий всегда им’еем дело с процедурой накопления данных ‘(N=N (О)-^-оо), поэто­му рассматриваемые ниже функции будем сопровождать индексом N.

Для больших N (при большом числе D (zn) — общем числе отказов) у-доверительный интервал для F (t) оп­ределяется неравенствами:

-Fw(0exp j — «T_jSw(0 і =g. FU)<.Fjv(Oexp ji/j^SwCO’ где SN(i) =

По доверительному интервалу можно приближенно ссудить о числе и достаточности исходных данных: если. доверительный интервал широкий, то исходных данных мало. Понятия «широкий», «узкий» доверительный ин­тервал, исходных данных «мало» или «много» по мере накопления опыта обработки исходных данных о надеж­ности приобретают более конкретный количественный смысл.

Выражение для у-доверительной полосы функции iF.(t) приведем для. практически важного случая цензу­рирования в предположении, ЧТО F(t) И G(it) (здесь lG{t) — функция распределения времени между момен­тами цензурирования) непрерывны и F(t}G(t)>0 для .любого t>Q. Тогда все ft и с, равны 1 или 0, n=N. В зтом случае для конечного t при iV->оо у-доверительную полосу вероятности безотказной работы F(s) (O^ssgii)

Уо(т. Д(0)( l-n2(s))
VN

Уо (у — «(О) ( 1 + cr2(s))

VN

Подпись: л FH(S) Подпись: X Подпись: 1 +
Подпись: _ А • fs^_F(,s)s^FN.(s) х:

определяем как

А

где a2 (s) =

г NdD (f)_____ у,_____________ її_______

{N(t)(N(t)- 1) _ J:fjLі JV(z,>[JV(z,) — 1] :

fl(0 = o*(0/(l+o*W),

функция t)0 (у, а) — табулирована (см., например, [5]). с. 36).

Оценку математического ожидания mF рассмотрим

— %N Ц

в виде тр= / F(s)ds. Оказывается, что

о _

VN{ihP—tnF}~N(0, s2),

СО,_ (X)_____ J

где s2= / ni2p(s)dA(s)/U(s)- mF(t) = J F(s)ds, Л(/)=1п —— ; о о F{t)

U(t)=F(t)G(t).

Впервые приведенный результат для оценки mF получен в 1[9]. Особо следует подчеркнуть, что выше все результаты были приведены в предположении исполь­зования статистической эксплуатационной информации, о надежности изделий, содержащейся в (5.1).

‘Получение результатов •непараметрического оценива­ния до сих «пор базировалось «а хорошо разработанной теории мартингалов (21, 26]. Однако в 1(4] Ю. К. Беляе­ву удалось вырваться из «плена» идей и методов теории мартингалов и получить оригинальные результаты непа­раметрического оценивания. Ему удалось рассмотрен­ные выше подходы распространить на более широкий класс функций распределения времени безотказной ра­боты изделий — на класс функций распределения F(t), не имеющих плотности (т. е. обладающих так называе­мым свойством дискретной разделимости). Считается, что функция распределения F-(t) не имеет плотности, когда скачки эмпирической функции распределения та — 176
кете, что ее практически нельзя сгладить непрерывной кривой (например, малые скачки чередуются с больши­ми). Для этого случая оценка функции F (t) в терминах функций D(t) й N(t), определяемых из табл. 5.1, запи­сывается как множительная оценка вида

F(t)= П {•l-AD(s)/N(s)), (5.6)

где в правой части учитываются только сомножители, для которых AD (s) ф1. Поэтому величины ДD(s) опре­деляются по (5.1) так: AD (гг) =/,->0. При этом! іф 1.

Оценка F(t) — обобщенная, оценка максимального правдоподобия (оценка максимального правдоподобия, распространенная в [4] на случай, когда функция F(t) не имеет плотности распределения). Оказалось, что по­лученная оценка состоятельна (іррубо говоря, чем боль­ше данных, в (5.1), тем эта оценка точнее).

В условиях эксплуатации изделий число поступаю­щих для обработки порций данных о надежности (обо­значим его через т) считаем достаточно большим, но конечным числом. Поэтому в [4] было получено выраже­ние для границ у-доверительных интервалов оценки (6.6) при т-^оо.

Явное выражение для границ асимптотически у-дове-

рительных интервалов оценки F ($) при т-^оо имеет вид следующих неравенств:

— f Г 11 1 _л л ( Г /і 1

ДМехрІ-Иі^у 2^0*1 ja^y 2^)4,

(5.7)

где N(Zi) определяется из объединенной таблицы данных D3 при m-кратном пополнении данных; ир — квантиль нормального распределения уровня р.

Таким образом, неравенства (5.7) имеют место с ве­роятностью, асимптотически стремящейся к у при /и->-оо. На практике для большого числа данных 200 и более отказов и цензурирований неравенство (5.7), хотя и является приближенным, но дает приемлемые резуль­таты. Их можно оценить моделированием. Границы у-доверительяых интервалов определяются как крайние члены неравенств (6.7).

При существенно большем числе данных о надежно­сти изделий (например, в статистическом центре обра­ботки данных отрасли, министерства и т. п.) бывает целесообразно построение у-доверительных полос для функции F(x), Xr<cl. В [4] обоснованы явные івьіражения для нижней и верхней границы асимптотически у-доее- рительной полосы. Эти выражения соответственно име­ют вид:

А

FB

(х)

.1 +

1 +с{х)

( ‘c(t)

Vm

Уо

V i + c(t)

(х)

1 +с(х)

{ с(0

F в

1 —

Vm

‘Уо

V 1 + с(0

X

Г

mdD (s)

п

-m’Ei

І — 1

•1

J

0

N (s)2

N(Zi)2

Значения Уо(у) табулированы [5]. Они определяются из уравнения

Р {(,<«« 1"’м| <«.<«, Y)}-*

где (s) — стандартный винеровский процесс, se[0, 1]. Значе­ния квантилей уо(у, а) уровня у для функции распределения мак­симального значения стандартного винеровского процесса (s) на интервале [О, а] вычисляются по стандартной программе.

Изложенный выше общий подход, предложенный Ю. К — Беляевым, успешно был применен для получения непараметрических статистических выводов о характе­ристиках надежности для математических моделей, опи­сывающих процессы длительной эксплуатации однотип­ных изделий, работающих в одинаковых условиях экс­плуатации. Это — процессы восстановления, альтерни­рующие случайные ‘Процессы (частная модель процессов с дискретным вмешательством случая) ‘[6].

Общность и продуктивность описанных подходов к непараметрическому оцениванию характеристик надеж­ности в [4] убедительно’ демонстрируются на примере альтернирующих процессов, хотя до сих пор не удава­лось с использованием результатов мартингальной тео­рии получить выражения для множительных оценок

ЩіЩіірсмшотических у-доверительных интервалов и полос.

Более того, предложен­ный Ю. К — Беляевым под­ход к непараметрическо­му оцениванию надежно­сти по результатам испы­таний и эксплуатации с успехом был применен к моделям, в основе кото­рых лежат полумарков — ские случайные процессы [6] и ветвящиеся случай­ные процессы [7]. Все на­званные классы случай­ных процессов и рассмот­ренные схемы цензуриро­вания широко применяют­ся в математических мо­делях технического обслу­живания и ремонта сложных систем.

Подпись:Подпись:Подпись: $0Подпись: 100Подпись: 150Подпись: Рис. 5il. Непараметрическая оцен- ка функции распределения При длительной эксплуатации (в одинаковых усло­виях) массового числа однотипных изделий в (5.1) на­капливаются сотни и более значений Zj. Универсальность выражений для точечных и интервальных оценок функ­ции F(t) позволяет при использовании ЭВМ обойтись небольшим набором программ.

Пример. Определим множительную оценку для плана испыта­ний [п, Б, г]і с п=20; /•=’2; /=.1,…, Эф Методом статистического моделирования по этим планам были получены результаты испыта­ний — 1ЮІ0 моментов отказов (гі=’5ЮХ’2=ПЮіО) для функции интен­сивности отказа

K{t) =2-iliOr4+il,’5-ilO-8(/ — .1ЮО)2.

При моделировании (поэтапно) данные испытаний (по специаль­ной программе — одной из девяти программ библиотеки программ) объединялись в общую таблицу данных типа D3 (но при т>2). Далее по следующей программе этой библиотеки на основе объеди­ненных данных вычислялись значения мнолштелъной оценки как при фиксированном значении t, так и в точках Zj, Б>’0 (для по­строения графика множительной оценки F(t)). На рис. 5.1 сплош-

— t

ной линией показаны функция Д(/)=ехр{— / X0(s)ds), найденная

О

множительная оценка показана в точках /=■50, UOO, 150> и 200 ч. Естественно, что получаемые точечные оценки будут ближе к соот­ветствующим значениям функции F (/) при увеличении общего ‘числа учитываемых отказов (величина d), т. е. при увеличении числа ре­зультатов испытаний, получаемых с помощью моделирования,